ElasticSearch Sudachi
ElasticSearchのpluginにsudachiを入れる
ポインター
WorksApplications/elasticsearch-sudachi: The Japanese analysis plugin for elasticsearch
Elasticsearchのための新しい形態素解析器 「Sudachi」 - Qiita
Install
6.4.1まで、release版があったので、それでbuildして、plugin install.
$ mvn package
$ sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install file:///analysis-sudachi-elasticsearch6.4-1.1.0.zip
$ /usr/share/elasticsearch/bin/elasticsearch-plugin list
参考
SudachiをElasticsearch6.1.1で使用する手順(非公式) - Qiita
Oracle Cloud Infrastructure環境にElasticsearchとSudachiプラグインをインストール - Qiita
elasticSearchのバージョンを合わせる。
version指定で、isntall(latestは6.5.1だったけど、6.4.2にdowngrade)
$ sudo apt install elasticsearch=6.4.2
$ sudo apt install kibana=6.4.2
が、なんかエラーになった。
elasticsearch.service: main process exited, code=exited, status=1/FAILURE · Issue #25505 · elastic/elasticsearch
に似てる。
諦めて Docker でやる
Install Elasticsearch with Docker | Elasticsearch Reference 6.5 | Elastic
これを6.4.2 にすれば良い。
マストドンの全文検索に形態素解析器 Sudachi を導入 - クラゲ丼
Sudachi に限りませんが Elasticsearch のプラグインは Elasticsearch とまったく同じバージョン番号のものしかインストールできません。
WorksApplications/elasticsearch-sudachi: The Japanese analysis plugin for elasticsearchを使わせてもらう
自分でいれたのだと、sudachiが使う設定ファイルや辞書もplugin配下に置いておく必要がある
code:conf.Dockerfile
FROM docker.elastic.co/elasticsearch/elasticsearch:6.4.2
COPY sudachi/analysis-sudachi-elasticsearch6.4.2-1.1.0.zip /usr/share/elasticsearch/
RUN elasticsearch-plugin install file:///usr/share/elasticsearch/analysis-sudachi-elasticsearch6.4.2-1.1.0.zip
COPY sudachi.json /usr/share/elasticsearch/plugins/analysis-sudachi/
COPY system_core.dic /usr/share/elasticsearch/plugins/analysis-sudachi/
code: 動作確認.json
GET /sudachi/_analyze
{
"analyzer": "sudachi_analyzer",
"text": "巨人ならこれは補強だろうがそれにしても今年はネームバリューもすごいな",
"explain": true
}
"explain" : true で、charfilter, tokenizer, tokenfilter別の処理が見える。